Os textos deste corpus esto distribudOs da seguinte forma:

1) pasta "Textos-fonte":

- subpasta "Textos-fonte com origem e ttulo": os textos-fonte completos esto distribudos em pastas que indicam o jornal de origem e sua seo;

- subpasta "Textos-fonte com ttulo": contm os textos-fonte completos;

- subpasta "Textos-fonte sem ttulo": contm os textos-fonte sem ttulo;

2) pasta "Sumrios":

- subpasta "Sumrios manuais": contm os sumrios dos textos-fonte, feitos pelo profissinal, em arquivos em formato txt. Estes esto diferenciados das subpasta "Sumrios manuais marcados": so os sumrios dos textos-fonte, feitos pelo profissinal, mas agora com indicao em vermelho das sentenas (ou de segmentos delas) que se relacionam  idia principal dos textos-fonte, conforme a percepo do profissional;

- subpasta "Extratos ideais automticos": contm as verses extrativas dos sumrios profissinais, geradas automaticamente por meio da medida do cosseno de Salton (1989).
